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上 节 课 我 们 主要 介绍 了 解决 线性 分 类 问题 的 一 个 简单 的 方法 : PLA。PLA 能 够 在 平面 
中 选择 一 条 直线 将 样本 数据 完全 正确 分 类 。 而 对 于 线性 不 可 分 的 情况 ， 可 以 使 用 
Pocket Algorithm 来 处 理 。 本 节 课 将 主要 介绍 一 下 机 器 学 习 有 哪些 种 类 ， 并 进行 归纳 。 


一 、Learning with Different Output Space Y 


我 们 在 上 节 课 引入 的 银行 根据 用 户 个 人 情况 判断 是 否 给 他 发 信用 卡 的 例子 ， 这 是 一 个 
典型 的 二 元 分 类 (binary classification) 问题 。 也 就 是 说 输出 只 有 两 个 ， 一 般 y={-1， 
+1}，-1 代 表 不 发 信用 卡 ( 负 类 ) ，+1 代 表 发 信用 卡 ( 正 类 ) 。 

二 元 分 类 的 问题 很 常见 ， 包 括 信 用 卡 发 放 、 垃 圾 邮件 判别 、 患 者 疾病 诊断 、 答 案 正确 
性 估计 等 等 。 二 元 分 类 是 机 器 学 习 领域 非常 核心 和 基本 的 问题 。 二 元 分 类 有 线性 模型 
也 有 非 线 性 模型 ， 根 据 实际 问题 情况 ， 选 择 不 同 的 模型 。 





除了 二 元 分 类 ， 也 有 多 元 分 类 (Multiclass Classification) 问题 。 顾 名 思 义 ， 多 元 分 类 


的 输出 多 于 两 个 ，y={1, 2, …, K}, K>2. 一 般 多 元 分 类 的 应 用 有 数字 识别 、 图 片 内 容 识 
别 等 等 。 


e Classify US coins (1c, 5c, 10c, 25c) 
by (Size, mass) 

e )= {1c,Sc,10c,25c}, of 
y=1{1,2,...,K} (abstractly) 

e。 binary classification: special case 

with K =2 





二 元 分 类 和 多 元 分 类 都 属于 分 类 问题 ， 它 们 的 输出 都 是 离散 值 。 二 对 于 另外 一 种 情 
况 ， 比 如 训练 模型 ， 预 测 房屋 价格 、 股 票 收益 多 少 等 ， 这 类 问题 的 输出 y=R， 即 范围 
在 整个 实数 空间 ， 是 连续 的 。 这 类 问题 ， 我 们 把 它 叫做 回归 (Regression) 。 最 简单 
的 线性 回归 是 一 种 典型 的 回归 模型 。 


除了 分 类 和 回归 问题 ， 在 自然 语言 处 理 等 领域 中 ， 还 会 用 到 一 种 机 器 学 习 问题 : 结构 
化 学 习 (Structured Learning) 。 结 构 化 学 习 的 输出 空间 包含 了 某 种 结构 在 里 面 ， 它 
的 一 些 解法 通常 是 从 多 分 类 问题 延伸 而 来 的 ， 比 较 复杂 。 本 系列 课程 不 会 详细 介绍 
Structured Learning， 有 兴趣 的 读者 可 以 自行 对 它 进 行 更 深入 的 研究 。 


简单 总 结 一 下 ， 机 器 学 习 按 照 输出 空间 划分 的 话 ， 包 括 二 元 分 类 、 多 元 分 类 、 回 归 、 
结构 化 学 习 等 不 同 的 类 型 。 其 中 二 元 分 类 和 回归 是 最 基础 、 最 核心 的 两 个 类 型 ， 也 是 
我 们 课程 主要 介绍 的 部 分 。 


Learning with Different Output Space YY 
e binary classification: ?7 = {—1, +1} 
。 multiclass classification: 7y = {1,2,... ,K} 
e regression: Y=R 
e Structured learning: Y = structures 

... and a lot more!! 
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二 、Learning with Different Data Label yn 


如 果 我 们 拿 到 的 训练 样本 D 既 有 输入 特征 x， 也 有 输出 yn， 那 么 我 们 把 这 种 类 型 的 学 习 
称 为 监督 式 学 习 (Supervised Learning) 。 监 督 式 学习 可 以 是 二 元 分 类 、 多 元 分 类 或 
者 是 回归 ， 最 重要 的 是 知道 输出 标签 yn。 与 监督 式 学 习 相 对 立 的 另 一 种 类 型 是 非 监督 
式 学 习 (Unsupervised learning) 。 非 监督 式 学 习 是 没有 输出 标签 yn 的 ， 典 型 的 非 监 
督 式 学 习 包 括 : 聚 类 (clustering) 问题 ， 比 如 对 网 页 上 新 闻 的 自动 分 类 ; 密度 估计 ， 

比如 交通 路 况 分 析 ; 异常 检测 ， 比 如 用 户 网 络 流量 监测 。 通 常情 况 下 ， 非 监督 式 学 习 
更 复杂 一 些 ， 而 且 非 监督 的 问题 很 多 都 可 以 使 用 监督 式 学 习 的 一 些 算法 思想 来 实现 。 





supervised multiclass classification unsupervised multiclass classification 
< ‘Clustering’ 


介 于 监督 式 和 非 监督 式 学 习 之 间 的 叫做 半 监 督 式 学 习 (Semi-supervised 

Learning) 。 顾 名 思 义 ， 半 监督 式 学 习 就 是 说 一 部 分 数据 有 输出 标签 yn， 而 另 一 部 分 
数据 没有 输出 标签 yn。 在 实际 应 用 中 ， 半 监督 式 学 习 有 时 候 是 必须 的 ， 比 如 医药 公司 
对 某 些 药物 进行 检测 ， 考 虑 到 成 本 和 实验 人 群 限制 等 问题 ， 只 有 一 部 分 数据 有 输出 标 


签 yn。 


监督 式 、 非 监督 式 、 半 监督 式 学 习 是 机 器 学 习 领 域 三 个 主要 类 型 。 除 此 之 外 ， 还 有 一 
种 非常 重要 的 类 型 : 增强 学 习 (Reinforcement Learning) 。 增 强 学 习 中 ， 我 们 给 模 
型 或 系统 一 些 输 入 ， 但 是 给 不 了 我 们 希望 的 真实 的 输出 y， 根 据 模 型 的 输出 反馈 ， 如 果 
反馈 结果 良好 ， 更 接近 真实 输出 ， 就 给 其 正 向 激励 ， 如 果 反 馈 结 果 不 好 ， 偏 离 真 实 输 
出 ， 就 给 其 反 向 激励 。 不 断 通 过 “反馈 -修正 "这 种 形式 ， 一 步 一 步 让 模型 学 习 的 更 好 ， 
这 就 是 增强 学 习 的 核心 所 在 。 增 强 学 习 可 以 类 比 成 训练 宠物 的 过 程 ， 比 如 我 们 要 训练 
狗 狗 坐 下 ， 但 是 狗 狗 无 法 直接 听 懂 我 们 的 指令 “sit down”。 在 训练 过 程 中 ， 我 们 给 狗 狗 
示意 ， 如 果 它 表现 得 好 ， 我 们 就 给 他 奖励 ， 如 果 它 做 跟 sit down 完 全 无 关 的 动作 ,我 
们 就 给 它 小 小 的 惩罚 。 这 样 不 断 修正 狗 狗 的 动作 ， 最 终 能 让 它 按照 我 们 的 指令 来 行 
动 。 实 际 生活 中 ， 增 强 学 习 的 例子 也 很 多 ， 比 如 根据 用 户 点 击 、 选 择 而 不 断 改进 的 广 


简单 总 结 一 下 ， 机 器 学 习 按 照 数 据 输出 标签 yn 划分 的 话 ， 包 括 监 督 式 学 习 、 非 监督 式 
学 习 、 半 监督 式 学 习 和 增强 学 习 等 。 其 中 ， 监 督 式 学 习 应 用 最 为 广泛 。 


Learning with Different Data Label y,, 
。 Supervised: all yn 
e UnSsupervised: no yn 


e。 Semi-Supervised: some yn 
Unknown target function A S 
。 reinforcement: implicit yn by goodness( yn) 


... and morell 
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二 、Learning with Different Protocol f(xn,yn) 
按照 不 同 的 协议 ， 机 器 学 习 可 以 分 为 三 种 类 型 : 


。 Batch Learning 
。 Online 


。 Active Learning 


batch learning 是 一 种 常见 的 类 型 。batch learning 获 得 的 训练 数据 D 是 一 批 的 ， 即 一 次 
性 拿 到 整个 D， 对 其 进行 学 习 建 模 ， 得 到 我 们 最 终 的 机 器 学 习 模 型 。batch learning 在 
实际 应 用 中 最 为 广泛 。 


online 是 一 种 在 线 学 习 模型 ， 数 据 是 实时 更 新 的 ， 根 据 数 据 一 个 个 进来 ， 同 步 更 新 我 
们 的 算法 。 比 如 在 线 邮件 过 滤 系统 ， 根 据 一 封 一 封 邮 件 的 内 容 ， 根 据 当 前 算法 判断 是 
否 为 垃圾 邮件 ， 再 根据 用 户 反 馈 ， 及 时 更 新 当前 算法 。 这 是 一 个 动态 的 过 程 。 之 前 我 
们 介绍 的 PLA 和 增强 学 习 都 可 以 使 用 online 模 型 。 


active learning 是 近 些 年 来 新 出 现 的 一 种 机 器 学 习 类 型 ， 即 让 机 器 具备 主动 问 问题 的 能 
力 ， 例 如 手写 数字 识别 ， 机 器 自己 生成 一 个 数字 或 者 对 它 不 确定 的 手写 字 主 动 提问 。 
active learning 优 势 之 一 是 在 获取 样本 label 比 较 困 难 的 时 候 ， 可 以 节约 时 间 和 成 本 ， 只 
对 一 些 重 要 的 label 提 出 需求 。 


简单 总 结 一 下 ， 按 照 不 同 的 协议 ， 机 器 学 习 可 以 分 为 batch, online, active。 这 三 种 学 
习 类 型 分 别 可 以 类 比 为 : 填 鸭 式 ， 老 师 教 学 以 及 主动 问 问题 。 


Learning with Different Protocol f => (xn, yn) 
e batch: all known data 

。 online: Sequential (passive) data 

e active: strategically-observed data 

e ...andmorell 

















Unknown target function 
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四 、Learning with Different Input Space X 


上 面 几 部 分 介绍 的 机 器 学 习 分 类 都 是 根据 输出 来 分 类 的 ， 比 如 根据 输出 空间 进行 分 
类 ， 根 据 输出 y 的 标记 进行 分 类 ， 根 据 取 得 数据 和 标记 的 方法 进行 分 类 。 这 部 分 ， 我们 
将 谈 谈 输 入 X 有 哪些 类 型 。 


输入 X 的 第 一 种 类 型 就 是 concrete features。 比 如 说 硬币 分 类 问题 中 硬币 的 尺寸 、 重 量 
等 ; 比如 疾病 诊断 中 的 病人 信息 等 具体 特征 。concrete features 对 机 器 学 习 来 说 最 容 
易 理解 和 使 用 。 


第 二 种 类 型 是 raw features。 比 如 说 手写 数字 识别 中 每 个 数字 所 在 图 片 的 mxn 维 像素 
值 ; 比如 语音 信号 的 频谱 等 。raw features 一 般 比较 抽象 ， 经 常 需要 人 或 者 机 器 来 转换 
为 其 对 应 的 concrete features， 这 个 转换 的 过 程 就 是 Feature Transform。 


第 三 种 类 型 是 abstract features。 比 如 某 购 物 网 站 做 购买 预 浊 时 ， 提 供给 参赛 者 的 是 抽 
象 加 密 过 的 资料 编号 或 者 ID ， 这 些 特征 X 完 全 是 抽象 的 ， 没 有 实际 的 物理 含义 。 所 以 
对 于 机 器 学 习 来 说 是 比较 困难 的 ， 需 要 对 特征 进行 更 多 的 转换 和 提取 。 

简单 忌 结 一 下 ， 根 据 输入 X 类 型 不 同 ， 可 以 分 为 concetet, raw, abstract。 将 一 些 抽象 


的 特征 转换 为 具体 的 特征 ， 是 机 器 学 习 过 程 中 非常 重要 的 一 个 环节 。 在 《机 器 学 习 技 
法 》 课 程 中 ， 我 们 再 详细 介绍 。 








Learning with Different Input Space ~ 


e Concrete: sophisticated (and related) 
physical meaning 


。 raw: simple physical meaning 
e。 abstract: no (or little) physical meaning 
。 ...and morel! 








unknown target function 
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五 、 总 结 。 


本 节 课 主要 介绍 了 机 器 学 习 的 类 型 ， 包 括 Out Space、Data Label、Protocol、Input 
Space 四 种 类 型 。 


e Learning with Different Output Space )] 
[classification], [regression], structured 
® Learning with Different Data Label yn 
[supervised], un/semi-supervised, reinforcement 
e Learning with Different Protocol f = (Xn, yn) 
[batch], online, active 
® Learning with Different Input Space ~X 
[concrete], raw, abstract 


注 明 : 
文章 中 所 有 的 图 片 均 来 自 台 湾 大 学 林 轩 田 《 机 器 学 习 基 石 》 课 程 。 


